快讯列表

关于 AI 计算代币 的快讯列表

时间 详情
2025-10-16
00:14
卡帕西发布 $1000 nanochat d32:33 小时完成训练、CORE 0.31、GSM8K 20%,关注 RNDR、AKT、TAO

据 @karpathy 表示,depth-32 的 nanochat d32 以约 $1000 成本、约 33 小时完成训练,并在预训练、SFT 与 RL 各阶段均有指标提升(来源:Karpathy 在 X;Karpathy GitHub nanochat 讨论)。其称该模型 CORE 得分为 0.31,高于 GPT-2 的约 0.26,且 GSM8K 从约 8% 提升至约 20%,对微型模型而言是显著进步(来源:Karpathy 在 X;Karpathy GitHub nanochat 讨论)。他提醒 nanochat 的训练成本为 $100–$1000,且 $100 版本参数量约为 GPT-3 的 1/1000,因而更易出现幻觉与不稳定表现,用户预期需保持克制(来源:Karpathy 在 X)。他还表示已在仓库提供 run1000 sh 等脚本,当前短期托管供测试,后续将优化训练吞吐并可能继续向更大模型扩展(来源:Karpathy 在 X;Karpathy GitHub 仓库)。对于交易者而言,提供 AI 工作负载的去中心化 GPU 网络如 Render(RNDR)、Akash(AKT)与 Bittensor(TAO)是值得关注的标的,因低成本开源训练有利于开发者试验与算力需求叙事(来源:Render Network 文档;Akash Network 文档;Bittensor 文档)。

来源